خوشه بندی سریهای زمانی با استفاده از الگوریتم ژنتیک

پایان نامه
  • وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی کامپیوتر
  • نویسنده محمدصادق شیخایی
  • استاد راهنما احمد عبداله زاده
  • تعداد صفحات: ۱۵ صفحه ی اول
  • سال انتشار 1386
چکیده

در سالهای اخیر داده کاوی برروی سریهای زمانی توجه بسیاری را به خود جلب کرده است. شاید بتوان گفت از میان تمام تکنیکهای به کار برده شده برروی سریهای زمانی، خوشه بندی پر استفاده ترین تکنیک می باشد. خوشه بندی سریهای زمانی می تواند به دلایل مختلفی مانند یافتن الگوهای پنهان در داده ها و جستجوی شباهتها انجام شود. سریهای زمانی معمولاً دارای ابعاد طولانی هستند که این امر کار پردازش آنها را چه از نظر حافظه و چه از نظر زمان با مشکل روبرو می سازد. اما خوشبختانه به دلیل وابستگی زیاد بین مقادیر متوالی یک سری زمانی، تکنیکهای کاهش ابعاد داده راهکار مناسبی برای حل مشکل ابعاد آنها می باشد. با توجه به اینکه موضوع مورد بررسی ما خوشه بندی است، ما به بررسی تأثیر پنج روش مختلف کاهش ابعاد داده در خوشه بندی به وسیله الگوریتم k-means پرداخته و با انجام آزمایشات وسیع به این نتیجه رسیدیم که خوشه بندی برروی درصد بسیار کمی از مهمترین مولفه های استخراج شده از داده ها می تواند به نتایجی بسیار نزدیک به خوشه بندی برروی داده های اصلی منجر شود. همچنین با ایجاد دو تغییر اساسی در روش random projection، روش جدیدی به نام sample based projection برای کاهش ابعاد داده ارایه کردیم که در آزمایشات انجام شده، عملکرد خوبی از خود به نمایش گذاشت بطوری که وقتی ابعاد داده های کاهش یافته را کوچک (مثلاً کمتر از 8) در نظر گرفتیم، از پنج روش دیگر بجز روش principle component analysis بهتر عمل کرد. در ادامه الگوریتمی به نام aku-kmeans برای خوشه بندی سریهای زمانی ارایه کرده ایم که چه از نظر زمان اجرا و چه از نظر معیار icv (که از آن برای ارزیابی خوشه بندی استفاده کرده ایم) بهتر از الگوریتم k-means عمل می کند. در روش پیشنهاد شده، الگوریتم k-means برروی داده های بُعدی انجام می شود که عددی کوچک مانند 1، 2 و یا 4 می باشد. سپس بطور متوالی ابعاد داده ها از به افزایش یافته و الگوریتم k-means برروی داده های کاهش یافته جدید که دارای دقت بیشتری هستند انجام می شود. این روند آنقدر ادامه می یابد تا خوشه بندی بهتری پیدا نشود. از آنجایی که خوشه بندی یکی از مسایل بهینه سازی به شمار می آید از الگوریتم ژنتیک نیز می توان برای حل آن استفاده نمود. تا کنون چندین روش برای خوشه بندی داده ها با استفاده از الگوریتم ژنتیک ارایه شده است اما در هیچکدام از آنها توجهی به ابعاد داده ها نشده است. ما با به کار گیری ایده مطرح شده در الگوریتم aku-kmeans، یک الگوریتم ژنتیک برای خوشه بندی سریهای زمانی ارایه کردیم.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

یک روش ترکیبی خوشه بندی مبتنی بر الگوریتم ژنتیک با استفاده از عملگر های جدید تغییر

  The clustering problem under the criterion of minimum sum of squares is a non-convex and non-linear program, which possesses many locally optimal values, resulting that its solution often being stuck at locally optimal values and therefore cannot converge to global optima solution. In this paper, we introduce several new variation operators for the proposed hybrid genetic algorithm for the cl...

متن کامل

سامانه طراحی سه بعدی لباس با استفاده از الگوریتم ژنتیک محاوره ای و خوشه بندی k-means

در عصر حاضر، با توسعه روزافزون فناوریهای رقمی و کاربرد آن در ارتقا و تسریع روند تولیدات هنری و نیز کاهش بهر هوری رو ش هایسنتی، کاربرد رایانه در طراحی لباس جایگاه ویژه ای یافته است. در این پژوهش، سامانه طراحی سه بعدی لباس با استفاده از الگوریتمژنتیک محاور های و خوشه بندی k-means ارائه شده است. با استفاده از نرم افزار طراحی لباس، اجزای لباس شنای زنانه شامل بالاتنه،میان تنه و پای...

متن کامل

سامانه طراحی سه بعدی لباس با استفاده از الگوریتم ژنتیک محاوره ای و خوشه بندی k-means

در عصر حاضر، با توسعه روزافزون فناوریهای رقمی و کاربرد آن در ارتقا و تسریع روند تولیدات هنری و نیز کاهش بهر هوری رو ش هایسنتی، کاربرد رایانه در طراحی لباس جایگاه ویژه ای یافته است. در این پژوهش، سامانه طراحی سه بعدی لباس با استفاده از الگوریتمژنتیک محاور های و خوشه بندی k-means ارائه شده است. با استفاده از نرم افزار طراحی لباس، اجزای لباس شنای زنانه ش...

متن کامل

بهینه سازی مسیر تردد سرویسهای حمل و نقل یک شرکت، با استفاده از خوشه بندی و الگوریتم ژنتیک

یکی از راهکارهای استفاده پایدار از منابع، سیستم حمل و نقل ادارات است. امروزه، سامانه های حمل و نقل به صورت دلخواه و با نظر افراد تعیین می شوند، در حالی که این انتخاب بهینه نیست. بنابراین باید روشی اتخاذ شود که بتوان این مسئله را به صورت کارآمد مدل کرد. از سوی دیگر در صورتی که تعداد کارمندان در یک شرکت زیاد باشد، فضای جستجوی مسئله افزایش پیدا کرده و استفاده از الگوریتمهای ریاضی مشکل است. به همین...

متن کامل

خوشه بندی خودکار داده های مختلط با استفاده از الگوریتم ژنتیک

مساله خوشه بندی به منظور کمینه کردن مجموع مجذور انحراف، یک مساله غیر خطی و غیر محدب بوده و دارای تعداد زیادی نقاط بهینه محلی است. در مسائل خوشه­بندی در دنیای واقعی، اغلب با مجموعه داده­هایی مواجهیم که از ترکیبی از مقادیر عددی و دسته­ای تشکیل شده­اند. در حالیکه اغلب روشهای خوشه­بندی موجود تنها بر روی داده­های عددی از کارایی مناسبی برخوردارند و قابلیت استفاده بر روی داده­های مختلط را ندارند. از س...

متن کامل

تعیین توصیفگرهای بهینه در خوشه بندی داده های لیدار با استفاده از الگوریتم ژنتیک

در سال­های اخیر، تکنولوژی لیدار به عنوان یک تکنولوژی کارآمد در کسب اطلاعات سه­بعدی از زمین شناخته شده و هر روز بیش از پیش مورد توجه مهندسین و متخصصان مهندسی ژئوماتیک قرار می­گیرد. استخراج عوارض از داده­های لیدار به عنوان یکی از مسائل مهم در پردازش این اطلاعات به  شمار می­آید. یکی از راه­های استخراج اتوماتیک عوارض از این داده­ها استفاده از الگوریتم­های خوشه­بندی می‍باشد. تعیین روش بهینه خوشه­بند...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023